home *** CD-ROM | disk | FTP | other *** search
/ Turnbull China Bikeride / Turnbull China Bikeride - Disc 2.iso / STUTTGART / SOUND / SOUNDCON00 / !SoundCon / Docs / Formats next >
Text File  |  1995-04-06  |  11KB  |  281 lines

  1. Description of formats supported by SoundCon
  2. ============================================
  3.  
  4.  
  5. There are two general classes of sound sample formats, compressed and
  6. uncompressed. Uncompressed samples are described relatively simply by the
  7. number of channels, bits per sample and sample format. Compressed samples
  8. are usually more complex; these are described later.
  9.  
  10. The sub-formats of each format is not described indivually because they are
  11. simply providing you with a choice of standard sub-formats. The meanings of
  12. the items found in the sub-menus (and the raw data interpretation menu) are
  13. described here:
  14.  
  15.   - Mono and stereo are for one and two channel samples. Note that stereo
  16.     samples must be interleaved in blocks of one (ie LRLRLRLR...). Formats
  17.     like AudioWorks (which interleaves in blocks of eight) can't be
  18.     interpreted as raw data by SoundCon and has special conversion code to
  19.     deal with that. One or two channels are supported for output conversion
  20.     and playback. Up to four are supported for conversion input.
  21.  
  22.   - 8 and 16 bit is for bits per sample. This only applies to the linear
  23.     samples since µ-law and VIDC are defined as 8-bit formats. 12 bit
  24.     samples are not supported.
  25.  
  26.   - Little and Big endian describes how to interpret 16-bit samples (or
  27.     any number stored in more than one byte). Little endian means the least
  28.     significant byte is stored first and Big endian means the most
  29.     significant byte is stored first. Little endian is the usual format for
  30.     formats originating from Arm and Intel based compuuters (eg Arc, PC) and
  31.     big endian is the usual format for formats originating from Motorola
  32.     based machines (eg Mac, Amiga).
  33.  
  34.   - Signed linear samples are stored as 2's complement numbers (ie signed)
  35.     that are directly proportional to the instantaneous amplitude of the
  36.     sample (ie linear).
  37.  
  38.   - Unsigned linear samples similar except that the maximum amplitude is
  39.     added to all samples (ie 128 for 8-bit, 32768 for 16-bit) to make all
  40.     the numbers positive (ie unsigned). In practise only the sign bit has to
  41.     be changed to convert from signed to unsigned.
  42.  
  43.   - µ-law samples are logarithmic which gives them a better dynamic range
  44.     than linear samples. Linear samples usually need to be about 12 bits to
  45.     provide the same low-amplitude resolution as µ-law. This format is
  46.     common on Unix machines.
  47.  
  48.   - Arc VIDC is the internal format used by the sound system on the
  49.     Archimedes making it a logical way to store samples on the Arc. It's
  50.     very similar to µ-law.
  51.  
  52.   - A-law is another logarithmic variation again similar to mu-law. This is
  53.     not supported by SoundCon yet.
  54.  
  55.  
  56. Major format summaries
  57. ----------------------
  58.  
  59. Unless otherwise noted the PlaySample module used by SoundCon can play
  60. samples that are any combination of:
  61.  
  62.   - 8 or 16 bit
  63.   - mono or stereo
  64.   - linear signed, linear unsigned, mu-law or Arc VIDC
  65.  
  66. with the exception that 16 bits samples which can only be linear since
  67. mu-law and Arc VIDC are not actually defined for anything other than 8-bit.
  68.  
  69. Playback lists use the following summaries:
  70.  
  71.   - mono/stereo 8        (8-bit linear signed or unsigned)
  72.   - mono/stereo 16       (16-bit linear signed or unsigned)
  73.   - mono/stereo 8 slin   (8-bit signed linear)
  74.   - mono/stereo 8 ulin   (8-bit unsigned linear)
  75.   - mono/stereo 16 slin  (16-bit signed linear)
  76.   - mono/stereo 16 ulin  (16-bit unsigned linear)
  77.   - mono/stereo mu-law   (8-bit mu-law)
  78.   - mono/stereo VIDC     (8-bit Archimedes VIDC)
  79.  
  80. A summary like "mono/stereo 8/16" means all combinations are allowable, ie
  81. "mono 8, stereo 8, mono 16, stereo 16".
  82.  
  83.  
  84. The following major formats are supported by this version of SoundCon.
  85.  
  86.   Audio IFF
  87.   Armadeus
  88.   ARMovie (read only)
  89.   Sun Audio
  90.   Audioworks
  91.   IFF/8SVX
  92.   Raw data
  93.   VOC (Creative Voice)
  94.   Voice module (write only)
  95.   RIFF WAVE
  96.  
  97.  
  98. Audio IFF
  99.  
  100.   Audio IFF (Interchange File Format) is a standard 'chunked' file format
  101.   which supports a wide range of sound sub-formats. This format originated
  102.   on Apple computers so multi-byte numbers are big endian.
  103.  
  104.   Channels: Any number of channels can be represented (in theory, up to
  105.   2^32). SoundCon can read up to 4 channels and write up to 2.
  106.  
  107.   Bits: Anywhere from 1-32 bits per sample can be represented. SoundCon can
  108.   read from 1-24 bits and can write 8 or 16 bits.
  109.  
  110.   Format: The format is always linear signed left justified to make it byte
  111.   aligned. eg for 4-bit samples, the 4 most significant bits of a byte are
  112.   used. For 12 bits sample, the 12 most significant of 2 bytes are used.
  113.   Samples are always byte aligned (ie they are not packed).
  114.  
  115.   Playback: Mono/stereo 8 slin/16 slin
  116.  
  117.  
  118. Armadeus
  119.  
  120.   Armadeus is a simple Archimedes format. Its only variable is the playback
  121.   frequency (stored as the sample period in microseconds in the first byte
  122.   of the file). The format is fixed as 8-bit linear signed (ie 2's
  123.   complement). The only way to identify these samples is by file type as no
  124.   charactersing information is stored in the file.
  125.  
  126.   Playback: Mono 8 (ie yes!)
  127.  
  128.  
  129. ARMovie
  130.  
  131.   ARMovie is the soundtrack part of Acorn Replay files. SoundCon cannot
  132.   currently export ARMovies.
  133.  
  134.   Channels: mono or stereo
  135.  
  136.   Format: linear signed or unsigned (8 or 16 bit) or 8-bit VIDC
  137.  
  138.   Playback: Mono/stereo 8/16/VIDC (but only if the data is continuous. Sound
  139.   is normally interleaved with video data so generally only sound-only
  140.   ARMovies can be played.)
  141.  
  142.  
  143. Sun Audio
  144.  
  145.   This format originated on Unix computers. 8khz mu-law is a very common
  146.   sub-format for this although it can support many (only a couple of which
  147.   are supported by SoundCon).
  148.  
  149.   Channels: Any number of channels can be represented (in theory, up to
  150.   2^32). SoundCon can read up to 4 channels and write up to 2.
  151.  
  152.   Bits: This depends on the format. 8, 16, 24 or 32 can be represented.
  153.  
  154.   Format: Sun Audio now supports a large number of formats. Basically there
  155.   is 8-bit, 8-bit A-law, compressed samples and various representations of
  156.   8, 16, 24 and 32-bit linear samples. SoundCon can read 8-bit mu-law and 8,
  157.   16, 24 and 32-bit linear samples with up to 4 channels. It can write 8-bit
  158.   mu-law, 8 and 16-bit linear samples with up to 2 channels.
  159.  
  160.   Playback: Mono/stereo 8 slin/16 slin/u-law
  161.  
  162.  
  163. AudioWorks
  164.  
  165.   This is a versatile Archimedes format based on the Acorn Chunk File
  166.   Format.
  167.  
  168.   Channels: Up to 255 channels in theory. SoundCon can read up to 4 channels
  169.   and write up to 2. Note that for polyphonic samples samples are
  170.   interleaved in blocks of 8.
  171.  
  172.   Bits: 8, 12 or 16 bits for linear formats, 8-bits for the others.
  173.  
  174.   Format: Linear signed, Linear unsigned, mu-law, A-law and Archimedes VIDC.
  175.  
  176.   Playback: Mono/stereo 8/16/u-law/VIDC
  177.  
  178.  
  179. IFF/8SVX
  180.  
  181.   This is a cousin of Audio IFF (they both use the IFF chunk format) that
  182.   specifically holds 8-bit mono samples (usually instrument voices). It
  183.   supports section repeating and data compression; neither of which are
  184.   supported by SoundCon.
  185.  
  186.   Playback: Mono 8 slin (ie yes)
  187.  
  188.  
  189. VOC
  190.  
  191.   The Creative Voice format (VOC) is a PC sourced format similar to 8SVX. It
  192.   can represent silence blocks, repeat blocks and compression. SoundCon can
  193.   only handle trivial VOCs currently - mainly because I haven't been able to
  194.   find any reliable information on this format.
  195.  
  196.   Playback: Mono 8 ulin. If the sample is made up of continued blocks there
  197.   will be clicking in the playback (which SoundCon warns you of). This will
  198.   not be present when it is converted to another format.
  199.  
  200.  
  201. Voice module
  202.  
  203.   Voice modules are basically self-playing samples; they are stored in the
  204.   mono VIDC format. The module provided a single command; Splay_xxx where
  205.   xxx is the filename given when saved. Executing this command causes the
  206.   module to claim a sound channel, play the sound at the originally
  207.   sampled rate and release the channel when its finished. This is a
  208.   transient playback since it only attaches itself to the sound system
  209.   temporarily.
  210.  
  211.   There are three option sets provided by SoundCon:
  212.  
  213.   Transient/voice: A voice attaches itself to the system voice list when it
  214.   is loaded so that it can be subsequently assigned to a sound channel and
  215.   played. A transient voice does not declare itself as a voice and can only
  216.   be used by issuing a star command.
  217.  
  218.   Fixed/variable frequency: Variable frequency sounds are normal instrument
  219.   sounds that can have their pitch altered by the sound command. Fixed
  220.   frequency mode is useful for 'effect' samples where the idea is to
  221.   reproduce the original sound. In this case, the sample is played the
  222.   sampled frequency and cannot be altered at play time.
  223.  
  224.   Volume mode: There are four volume modes:
  225.   - Normal vol: The volume is controlled as normal by the channel volume in
  226.     the sound command and by the overall system volume.
  227.   - Sys vol: The channel volume in the sound command is ignored (maximum is
  228.     used) so only the overall system volume affects the volume.
  229.   - Channel vol: The overall system volume is ignored (works as if it was
  230.     maximised) and the volume is controlled solely by the sound command.
  231.   - Fixed vol: All volume settings are ignored. The volume used is that of
  232.     playback slider in SoundCon when you initiate the save.
  233.  
  234.   Playback: Yes! (mono VIDC)
  235.  
  236.  
  237. RIFF WAVE
  238.  
  239.   The WAVE format is one of the many supported chunks in the RIFF 'chunked'
  240.   file format which supports a wide range of sound sub-formats. This format
  241.   originated on PCs so multi-byte numbers are little endian.
  242.  
  243.   Channels: Usually one or two supported although up to 65536 could
  244.   theoretically be stored. SoundCon can read up to 4 channels and write up
  245.   to 2.
  246.  
  247.   Bits: Depends on the format.
  248.  
  249.   Format: WAVE supports numerous formats many of which are difficult to find
  250.   information about. The ones supported by SoundCon are:
  251.     PCM: 8 bit linear unsigned or 16 bit signed, mono or stereo.
  252.     mu-law: 8-bit logarithmic format, mono or stereo.
  253.     MS ADPCM: 4-bit Microsoft ADPCM, mono or stereo.
  254.     DVI ADPCM: 4-bit Intel ADPCM, mono or stereo.
  255.  
  256.   Playback: mono/stereo 8/16/mu-law/MSADPCM/DVI ADPCM (ie all those
  257.   recognised)
  258.  
  259.  
  260.  
  261. ADPCM formats
  262. =============
  263.  
  264. ADPCM (Adaptive Delta Pulse Code Modulation) is a way of storing sound in a
  265. compressed format. It is not an algorithm per se but simply says that the
  266. sound samples are encoded in some way using the differences between samples
  267. (ie deltas). Pulse Code Modulation (PCM) is basically a fancy way of saying
  268. 'digitised sound'. There are many different ADPCM algorithms and SoundCon
  269. supports the only two I could find information on.
  270.  
  271. Sound is typically very difficult to compress and standard compression
  272. techniques like LZH will maybe save 25% if you're lucky. ADPCM algorithms
  273. are lossy (imperfect) compression techniques garanteed to give a highish
  274. compression ratio. Usually samples are stored as 4-bit encoded deltas (75%
  275. saving on 16-bit samples) and the quality is good, though not perfect;
  276. rather like JPEG picture compression.
  277.  
  278. Because ADPCM algorithms rely on local trends in the sound wave to predict
  279. what the next sample will be, they do not encode noisy sounds (having a
  280. random element) very well. They do well on things like large music files.
  281.